ULISSES: un Integrated Development Environment desarrollado para la anotación de un corpus romancístico

نویسنده

  • Natália Albino Pires
چکیده

Ulisses is an Integrated Development Environment developed for the annotation of a corpus comprised of ballads from the portuguese modern oral tradition, featuring a modular structure which allows the integration of new tools and functionality.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

De la especificidad de un corpus romancístico a la creación de una nueva aplicación: ULISSES

On this paper we intend to account for how the singularities of a corpus comprised of versions from the romancero of the portuguese modern oral tradition , totalling 1721 texts, have compelled us to build a new software application that answers the needs and goals of our research; afterwards we’ll describe the Ulisses application, the IDE which was specifically developed for the annotation and ...

متن کامل

How Does the Granularity of an Annotation Scheme Influence Dependency Parsing Performance?

The common use of a single de facto standard annotation scheme for dependency treebank creation leaves the question open to what extent the performance of an application trained on a treebank depends on this annotation scheme and whether a linguistically richer scheme would imply a decrease of the performance of the application. We investigate the effect of the variation of the number of gramma...

متن کامل

Un modelo para detectar la similitud semántica entre textos de diferentes longitudes

Resumen En el presente trabajo se desarrolla un modelo para resolver el problema de similitud semántica entre textos de diferente longitud. Se propone extraer caracteŕısticas léxicas, caracteŕısticas basadas en conocimiento y caracteŕısticas basadas en corpus, con el objetivo de desarrollar un modelo de aprendizaje supervisado. El modelo fue desarrollado utilizando regresión loǵıstica de la her...

متن کامل

Anotación automática de datos acerca de la reputación de los políticos en redes sociales

Resumen. Recientemente, la minerı́a de opinión en Twitter, por medio de la Recuperación de Información (RI) y del Procesamiento de Lenguage Natural (PLN) atrajo interés en la investigación polı́tica. Sin embargo, la obtención de datos anotados de dominio especı́fico sigue siendo un paso manual muy costoso. Además, la cantidad y calidad de estas anotaciones pueden ser crı́ticas en relación al rendim...

متن کامل

Aspectos ortográficos, léxicos y morfosintácticos del etiquetado lingüístico de un corpus de informática en lengua gallega

Resumen. En este trabajo se examinan algunos aspectos del etiquetado lingüístico de un corpus técnico de informática en lengua gallega, en lo que respecta a cuestiones ortográficas, léxicas y morfosintácticas. En primer lugar, presentamos la características del corpus analizado y algunas de las aplicaciones de su procesamiento. A continuación, mostramos las técnicas empleadas en su anotación mo...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • Procesamiento del Lenguaje Natural

دوره 37  شماره 

صفحات  -

تاریخ انتشار 2006